Resumo
Com base na análise de acidentes rodoviários de 2020, os principais pontos de risco foram identificados, revelando padrões geográficos, temporais e de condições específicas. A análise mostra que, embora Betim tenha o maior volume de acidentes, Patos de Minas apresenta a maior taxa de mortalidade. As rodovias BR-381 e BR-040 são as mais perigosas, com quilômetros específicos na BR-040 apontados como de alta criticidade. O tipo de acidente mais comum é a “saída de leito carroçável”. Fatores como o clima e o tipo de pista também são determinantes: a neblina e as pistas simples estão associadas a uma maior severidade dos acidentes. Temporalmente, os finais de semana concentram a maior frequência de ocorrências. O horário mais letal é a madrugada, apesar de a maioria dos acidentes ocorrer nos horários de pico. Observou-se também uma queda atípica em abril, possivelmente pela pandemia de COVID-19, e um pico em dezembro, relacionado às viagens de fim de ano.
1.1 Análise Preliminar dos Dados
Os dados já estão bem organizados e é possível inferir facilmente o significado das colunas. Um possível ponto de confusão é o formato da data (data_inversa), que segue o padrão internacional (ano/mês/dia).
Tabela 1.1: Resumo detalhado das variáveis do dataset de acidentes.
| Informação | Variável |
|---|---|
| Onde e Quando | id | data | dia | horário | uf | br (6% NA) | km (6% NA) | município |
| Como Aconteceu | tipo_acidente | fase_dia | condicao_metereologica | tipo_pista |
| Impacto do Acidente | pessoas | mortos | feridos | ilesos | veiculos |
| Localização Precisa | latitude | longitude |
1.1.1 Estatísticas Descritivas
A análise das estatísticas descritivas das variáveis numéricas não revelou, à primeira vista, dados suspeitos ou a existência de outliers evidentes, considerando valores como o número máximo e mínimo de feridos, o desvio padrão e a variância. Alguns achados interessantes envolvem os veículos, uma vez que a mediana é 1,0, enquanto a média é 1,55. Isso significa que mais de 50% dos acidentes registrados envolvem apenas um único veículo.
O número máximo de pessoas envolvidas é de 14; no entanto, a média é de 2,23 pessoas. Considerando as mortes e os feridos graves, a mediana, o primeiro e o terceiro quartil são zero. Portanto, pelo menos 75% de todos os acidentes neste dataset não tiveram vítimas fatais.
Além disso, existem pouquíssimos valores ausentes (NA), concentrados nas colunas br e km, que se referem, respectivamente, à rodovia e ao quilômetro onde o acidente ocorreu. Essas ausências correspondem a cerca de 6,12% do total de observações. Tais observações não aparentam ter um padrão em comum, seja em localização, número de vítimas ou tipo de acidente, o que sugere que podem ser falhas no momento do registro dos dados ou acidentes em locais não formalmente catalogados.
A matriz de correlação (Método de Spearman) indicou, em sua maioria, relações con- sideradas óbvias entre as variáveis. Como no correlogramas abaixo
As correlações mais fortes estão relacionadas ao número de pessoas envolvidas e suas consequências imediatas. Logicamente, se há mais pessoas, haverá mais veículos, feridos e ilesos. O restante das correlações observadas parece ser bem razoável.
As medidas de associação, por outro lado, trazem resultados mais curiosos. O município onde aconteceu o acidente parece ter relação com a maioria das variáveis, o que pode significar que municípios com estruturas viárias piores ou mais antigas influenciam o tipo de ocorrência. Além disso, o tipo de pista parece estar bem associado ao tipo de acidente.
1.2 Planejamento da Análise
Diante desse cenário e para realizar tanto as análises solicitadas quanto outras explorações pertinentes, elaboramos os seguintes eixos para guiar o trabalho.
Objetivo do Cliente
“Meu objetivo é avaliar as principais causas de acidentes nas rodovias de Minas Gerais, bem como um mapeamento dos tipos de acidentes e das rodovias. Também gostaria de entender os acidentes de acordo com variáveis relativas a tempo: dia da semana e mês.”
Eixos de Análise Propostos
- Análise das Causas de Acidentes:
- Distribuição por condição meteorológica.
- Distribuição por tipo de pista.
- Análise de Variáveis Temporais:
- Evolução mensal do número de acidentes.
- Distribuição de acidentes por dia da semana.
- Distribuição por faixa de horário.
- Análise de Variáveis Geográficas:
- Distribuição geográfica de mortos e feridos.
- Ranking das 10 principais rodovias (BRs) com maior número de ocorrências.
- Métricas e Proporções Chave:
- Taxa de mortalidade
- Taxa de feridos graves
- Taxa de ilesos
1.2 Análise das Causas de Acidentes
Distribuição por Condição Meteorológica
Quanto à influência do clima, observa-se que a maioria dos acidentes ocorre sob céu limpo. No entanto, a taxa de mortalidade é substancialmente maior em condições de neblina, o que reforça a necessidade de condução cuidadosa neste contexto.
Distribuição por Tipo de Pista
Embora o tipo de pista não apresente uma correlação intensa com a mortalidade geral, nota-se uma maior concentração de mortes em acidentes ocorridos em pistas simples.
Distribuição por Tipo de Acidente
O tipo de acidente mais frequente é a “saída de leito carroçável”, correspondendo a 25% do total das ocorrências. Este evento ocorre quando um veículo sai da pista e se desloca para uma área adjacente (barranco, ribanceira, etc.).
De acordo com o plot, pistas Duplas e Múltiplas mostram maior propensão a acidentes relacionados ao fluxo (colisão traseira), enquanto a pista Simples evidencia o alto risco de acidentes severos como a colisão frontal.
1.3 Análise Temporal
Acidentes por Mês
Dezembro destaca-se como o mês com o maior número de acidentes, uma tendência que pode ser atribuída ao aumento do tráfego durante as viagens de fim de ano. Em oposição, abril regista o menor volume de ocorrências, um resultado provavelmente relacionado com o fenómeno do isolamento social.
A análise mensal do total de acidentes revela uma queda acentuada em abril, que pode ser inferida como um resultado das restrições impostas pela pandemia de COVID-19. Em contrapartida, observa-se um pico de ocorrências em dezembro, possivelmente associado às viagens de fim de ano.
Quanto à distribuição semanal, sexta-feira, sábado e domingo são os dias com maior volume de acidentes, o que pode ser atribuído ao aumento do fluxo de veículos devido a lazer, viagens e outros compromissos de fim de semana.
Acidentes por Dia da Semana
As manhãs de sábado apresentam a maior proporção de ocorrências (19,5%), despontando como o período mais crítico. Em seguida, as noites de sexta-feira a domingo formam um bloco de alto risco, com proporções que variam de 16,9% a 18,5%. Este padrão sugere que o início e o fim dos períodos de lazer do fim de semana são momentos que demandam maior atenção e possíveis ações preventivas.
Acidentes por Hora do Dia
A análise por horário acompanha a mesma lógica dos dias úteis, com picos de acidentes no início da manhã (aproximadamente às 6h) e no final da tarde, coincidindo com os horários de deslocamento para o trabalho. No entanto, a mortalidade segue um padrão distinto: a madrugada concentra o maior número de mortes, com um aumento progressivo que se inicia no começo da noite.
1.4 Análise Geográfica
Top 10 Municípios com Mais Mortos e Feridos
Na análise das variáveis geográficas, percebe-se que, embora o município de Betim registre o maior número absoluto de acidentes, Patos de Minas apresenta o maior número de mortes.
Top 10 Rodovias (BRs) com Mais Ocorrências
Top 10 Pontos Críticos (BR + KM)
As rodovias BR-381 e BR-040 concentram o maior número de ocorrências, um dado consistente com a reputação de ambas. Uma análise mais detalhada por quilómetro revela que a BR-040 domina o ranking de pontos críticos, especialmente nos KMs 510 e 511. Esta concentração sugere a provável existência de uma falha grave de planeamento ou segurança nesse trecho específico.
1.5 Métricas e Proporções Chave
Taxas de Severidade e Ilesos (2020)
| Métrica | Valor (%) | Total Absoluto |
|---|---|---|
| Taxa de Mortalidade | 3.58% | 521 |
| Taxa de Feridos Graves | 12.66% | 1.845 |
| Taxa de Ilesos | 39.70% | 5.785 |
As taxas gerais do conjunto de dados revelam uma percentagem de acidentes fatais que, embora baixa, é significativa. A análise gráfica indica que, na maioria das ocorrências com vítimas fatais, regista-se apenas uma morte por acidente.
Para a análise da distribuição geográfica dos acidentes, foram gerados dois mapas interativos.
O primeiro mapa representa cada acidente como um círculo, onde o raio é proporcional à gravidade do evento (número de mortos). Esta visualização permite a rápida identificação dos acidentes mais letais e sua localização exata.
O segundo mapa utiliza uma técnica de clusterização (agrupamento), que agrupa acidentes geograficamente próximos em um único ponto. Essa abordagem é ideal para identificar “hotspots”, ou seja, as áreas com maior concentração e frequência de acidentes, limpando a visualização em escalas mais amplas.
##Conclusão
Este trabalho analisou os acidentes rodoviários em Minas Gerais durante o ano de 2020. A análise revelou que as rodovias BR-381 e BR-040 são os principais focos de ocorrências, com pontos específicos na BR-040 apresentando uma concentração de acidentes.
Temporalmente, os finais de semana e os horários de pico (manhã e final de tarde) registram o maior volume de colisões. Contudo, é na madrugada que o risco de morte se torna mais elevado. Fatores como pista simples e condições de neblina também foram associados a uma maior severidade dos acidentes, enquanto a “saída de leito carroçável” se destacou como o tipo de ocorrência mais frequente.
Os resultados apontam para a necessidade de intervenções estratégicas. A fiscalização deve ser intensificada nos trechos mais críticos identificados. Campanhas de segurança devem alertar para os perigos específicos da condução na madrugada e em condições climáticas adversas. A longo prazo, o investimento na melhoria da infraestrutura.
Embora limitado ao ano atípico de 2020, os dados se mostraram muito relevantes e completos, com diversas têndencias ao longo do EDA, como texto prático gostei muito de realizar o trabalho, agradeço a EstatMG pela oportunidade e quem sabe fazer parte do time!
Obrigado pela Atenção.